查看原文
其他

你见过最差的算法工程师能差到什么程度?

极市平台 2021-09-20

加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动!

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流。关注 极市平台 公众号 ,回复 加群,立刻申请入群~


本文来自知乎问答,回答均已获作者授权,禁止二次转载


问题:你见过最差的算法工程师能差到什么程度?

https://www.zhihu.com/question/347545092



知乎高质量回答


1、作者:夕小瑶

https://www.zhihu.com/question/347545092/answer/844111390


首先我个人觉得,算法工程师的目标既不是精通各种框架,会调各种包,也不是会发paper就是成功,而是有能力解决实实在在被提出的算法问题。


这里的问题可能来源于业务,也可能来源于长远的战略部署,甚至可能来源于一次大领导的拍脑袋。不管怎么说,个人觉得能独立分析,拆解,建模和解决算法问题的算法工程师就是胜任的,否则再怎么花里胡哨都是差劲的。


先说一下本文4个样本的背景,甲乙丙丁都是一线大厂的正式员工(包括知名外企),工龄从刚入职到3年不等,不过都不是自己团队的。


只是各种原因而接触到的NLP算法工程师。为了避免对号入座,将以下内容中的部分关键词打码。



出现一个奇怪现象后,我让他把训练loss画出来,结果他不知道怎么画。然后他不会用xx,我告诉他那就把日志中的loss点提取出来,用*来画。结果他问我*从哪里下载,有没有学习教程。


注:*是一个非常常用的python库


然后又一次,发给他一个非常简单的代码,他想改一下其中一个预处理逻辑,我告诉他在哪里改,他直接说看不懂,求帮他改。我问别人,那他拿着工资每天干什么呢,答曰,可能会写写paper?


结果最后那篇paper也不是他写的。



乙比甲好一些,乙想解决一个问题,于是我给他甩了一篇paper,然后他很多地方看不懂,于是这些细节我一点点给他讲。讲完后他要借鉴其中一个idea用代码实现,这个idea写起来就一二十行。他绕不清矩阵计算,让我教他写,我给他5分钟写完,他很努力的理解了,恍然大雾,拿去跑了,然后跑完觉得很棒,自己又想了一个可能的实现方案,然后问我另一个方案可行性,这两个方案在数学上是等价的,于是讲了等价后,开始问我另一个方案的每行代码应该怎么实现。


小哥哥,你是故意来搭讪的吧?



有一天我把甲的故事分享给了另一家大厂的小伙伴,小伙伴说,还好,他们组刚入职一个新人,第一次做技术分享,给大家讲了半小时的word2vec就结束了,据说,该同学非常费力的直译了论文原文一些内容,专业名词翻译错了他都不清楚,并且表示负采样没看懂,而且不重要,所以就不讲了。


问了一下丙后来怎么样了,说被调去做java了,小伙伴反馈丙做java开发还出活挺快的。



丁的故事来源于一个很要好的小伙伴,差点让小伙伴当场离职。丁是另一家很多人都想去的大厂的。丁的能力则是在甲乙丙之上,各种leetcode题刷的贼溜,textcnn之类的也都很熟,今年年初ta的mentor让ta用bert跑一下业务上的一个*分类任务,结果其一跑就是X个月,调了X个月后的结论是不如textcnn好用,线下稍微好一些,线上一塌糊涂。后来我一个刚去的小伙伴接手了ta的工作后,发现数据集里,预处理脚本里,训练脚本和评估脚本里全都有bug,从头到尾完全就是错的。小伙伴给ta修完bug后上升了近XX个点。


注:*取值小于5,X取值大于3,XX取值两位数


丁至今还是在岗的,因为ta的mentor也不太懂这块,mentor认为是bert代码太过复杂导致的,情有可原。


那么问题来了,甲乙丙丁是怎么通过各大厂面试的?靠刷题?靠学校背景?靠不可描述?这个问题我至今没想明白……



2、作者:盛夏的果核

https://www.zhihu.com/question/347545092/answer/840206839


下文所说的仅为AI算法工程师。


0级算法工程师——只知道神经网络和几个名词,这一级的人一谈到算法和人工智能,无脑牛逼(或无脑diss)就完事了。


1级算法工程师——拜读过西瓜书/小蓝书/花书,看过算法视频教程,对算法基础知识有一定的了解;掉过几个算法包,跑过几个模型和典型数据。这一级通常是调包侠,调参怪。口头禅:xxx算法模型是真的强!实际上对于算法原理思想一无所知,看的书也只是囫囵吞枣。


2级算法工程师——参加过一两个算法竞赛/项目,跑过知名的几个效果好的算法模型,并且获得了中规中矩的成绩(前10-20%)。此时认为算法不过如此,数据处理、特征构建、模型选择无非那么几种套路,仅仅靠着模型融合和毫无想法的数据处理过程来上分。这一级充斥着大量的校招算法工程师,承担着大中厂算法岗炮灰的角色。


3级算法工程师——参加一些算法竞赛并获得比较靠前的名次,对于使用的模型和方法有叫深入的理解,竞赛中存在独立和较深刻的思考。或者有关于算法项目相关的论文。这一级在基础算法能力上来说已经过关,可以找到还不错的工作。比较容易担忧的是自身的工程能力。


4级算法工程师——除了比较扎实的算法基础外,还有比较不错的工程能力。不仅理论知识过关,同时能将算法结合到业务场景、实际项目当中去,并对算法本身进行一定的更改以适应背景。这一级的人已经能成为offer收割机了,往往能拿到心仪的offer。


(我认为四级已经是绝大多数算法工程师的上限,对于工程师来说继续升级需要的是对相关业务的理解、敏锐度和工程能力了,超越了“算法”本身的范畴)


…………


N级算法工程师


对于现有的算法进行创新和改进/开发算法框架造福AI领域等造成比较大的影响的巨佬。这一级答主根本无法想象那种高度,实属算法领域的大牛级人物。



3、作者:LinT

https://www.zhihu.com/question/347545092/answer/865893798


强答一波,讲讲在学校或网上见到的现象(AI方面,严格来说,这些人放到今天的行业标准下,基本不可能成为一名算法工程师)。


(纯属吐槽,请勿对号入座)


百度百科型选手/PPT选手常见于各类创新竞赛、课程答辩,张口闭口一定是「人工智能」「神经网络」,上来一定要气压群雄,尽管对各类AI问题的进展没有任何了解,但是在他们这里,各种算法一定是封装好了,准确率100%,拿来就可以用(plug-and-play)的。什么文本情感分析做舆情监控啊,人脸识别智能面试啊,不在话下,章口就来。


博客型选手大概率尝试过Andrew Ng的网课,但大概率没看下去,手里一定有一本Python深度学习,对原理不求甚解,数学公式大概都不想看,论文不想读,辗转各个博客网站希望找到一个好一点的解读;跑了一通实例代码,很有成就感,可能会在某个博客网站发布一篇博客,标题诸如《自然语言处理入门-XXX》,成功为网络贡献一篇与其他博客雷同率90%的文章,虽然文章名字像是一个系列,但是相信我,他大概率不会再发布同系列的文章了。


Github选手常常和PPT选手合作,拿到需求,「人脸识别是吧?」,Github一搜,好多仓库,全克隆了再说;挑挑拣拣,调试了半天,依赖装完代码跑通了(没有error),任务完成,功德无量,接下来的任务交给其他队友!


AI+型选手(教师)传统方向出身,没有学过ML/DL,在AI兴起以后,把DL当万精油用,深度学习预测地震啊,深度学习验证软件啊...管它什么数据驱动不驱动,经费拿到手就行了。这类老师对AI的认知可能和PPT选手差不多,比学生多的本领就是写本子、打招呼了。带一个PPT选手加一个Github选手,基本上可以在各类创新竞赛/项目中拿到还不错的成绩。


名词流选手行走的AI术语词典,讨论问题时就喜欢堆砌名词,但从不解释,故弄玄虚,让外行有一种「不明觉厉」的感觉,其实一些言论根本经不起推敲。


潮流型选手走在AI潮流前列,除了最新的算法,其他的都是垃圾,「不加attention?你这算法不行!」,「2019年了,还用概率图模型?」这类人对算法应用场景一无所知,对新算法的狂热程度堪比娱乐圈流量小生的疯狂粉丝们。




何去何从型选手多半是半路出家,转行想做AI的,但是奈何基础弱,一心只想挣大钱,所以会很迷茫,于是到知乎抛下一个问题:「非cs科班可以学xxx吗?」「本人xx,应不应该xxx?」。奈何这类问题没有什么深度,基本得不到什么可以参考的回答。这类人问题不在没有基础,而在没有主见。


(别打我...)



-End-


*延伸阅读





CV细分方向交流群


添加极市小助手微信(ID : cv-mart),备注:研究方向-姓名-学校/公司-城市(如:目标检测-小极-北大-深圳),即可申请加入目标检测、目标跟踪、人脸、工业检测、医学影像、三维&SLAM、图像分割等极市技术交流群(已经添加小助手的好友直接私信),更有每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流,一起来让思想之光照的更远吧~



△长按添加极市小助手


△长按关注极市平台


觉得有用麻烦给个在看啦~  

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存